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摘 要 : 
人 文献 的 识别 方法 。 


[目的 /意义 ] 回顾 现 有 的 睡 美人 文献 识别 方法 ,梳理 不 同方 法 的 优 缺 点 ， 
[方法 /过 程 ] 基于 目前 发 展 较为 成 熟 的 Bep 指数 识别 法 ,借鉴 其 利用 引文 曲线 “离散 程度 ” 


尝试 兼顾 准确 性 与 易 操 作 性 来 改进 睡 美 


0 于 不 同 引文 曲线 类 型 的 区 分 ,从 而 提出 用 以 


识别 睡 美人 文献 的 PCV 指数 。 [ 结 

该 方法 对 总 0 
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结论 ] 识别 结果 显示 ,PCV 指数 能 够 较为 简单 、 准 确 地 识别 睡 美人 文献 , 且 


人 


6 科学 文献 的 生命 周期 与 老化 规律 是 科学 传播 研究 
电 乓 重要 内 容 之 一 。 一 般 而 言 , 文 献 会 在 发 表 后 的 几 
黄 被 其 他 文献 引用 ,并 乏 渐 达 到 引文 峰值 ,之 后 被 引 
兰 数 下 降 , 直 至 文献 不 再 被 引用 !) 。 然 而 ,有 学 者 发 现 
太一 类 文献 ,其 发 表 初 期 鲜 少 被 引用 ,经 历 一 段 闪 人 


斯 浊 后 被 引 量 突 增 。 计 量 学 家 A.F. J. van RaanD 将 
其 称 为 “科学 中 的 睡 美人 ”, 并 提出 了 沉睡 时 长 .睡眠 


汽 .唤醒 强度 3 项 指标 对 其 进行 揭示 ,此 后 ,这 类 现 
条 儿 新 被 定 量化 , 规 光 化 进行 研究 
“三 “ 睡 美人 ”现象 的 本 质 是 其 研究 内 容 属于 变革 人 性 
研 宠 或 超前 性 研究 ,识别 睡 美人 文献 有 助 于 完善 科 
学 评价 体系 ,鼓励 创新 性 研究 ,也 有 助 于 进一步 认识 科 
学 信息 流动 机 制 并 发 现 潜在 的 创新 点 。 这 赋予 了 睡 美 
人 文献 重要 的 研究 价值 ,也 使 得 睡 美人 文献 的 识别 工 
作成 为 图 书 情 报 领域 的 重要 研究 内 容 之 一 。 
1 识别 方法 概述 

目前 已 有 多 位 学 者 提出 了 识别 睡 美人 文献 的 方 
法 , 现 有 的 识别 方法 可 以 分 为 3 类 ” :四 曲线 拟 合法 
通过 数学 表达 式 或 适当 的 曲线 类 型 来 拟 合 单 篇 文献 被 
a 
观 指 标 法 :通过 设置 指标 并 人 为 设 定 阐 值 来 判断 一 篇 


mm 


文献 是 否 属于 睡 美 人 文献 ”“ ;@@ 窜 观 指标 法 :通过 
利用 指标 数值 的 大 小 衡量 一 篇 文献 可 以 被 看 作 是 睡 美 
人 文献 的 程度 , 从 而 消除 了 主观 设置 阔 值 的 随意 
性 

前 期 相关 调研 结果 显示 ,在 进行 独立 学 科 领 域 的 
睡 美人 文献 识别 工作 时 ,得 益 于 操作 简便 、 识 别 快速 ， 
主观 指标 法 的 使 用 率 远 高 于 其 他 方法 ,但 需要 人 为 设 
定 阔 值 ,存在 很 强 的 主观 性 , 且 容 易 造 成 识别 的 不 全 
面 "" 。 相 对 而 言 ,客观 指标 法 和 曲线 拟 合法 规避 了 界 
定 识 别 标准 时 的 随意 性 ,识别 结果 更 为 准确 ,但 计算 过 
程 较为 复杂 。 因 此 ,本 文 尝试 兼顾 准确 性 与 易 操 作 性 
对 睡 美人 文献 的 识别 方法 进行 进一步 的 探索 。 
2 方法 提出 

近年 来 , 睡 美人 文献 的 识别 方法 呈现 出 由 主观 指 
标 向 客观 指标 演变 的 趋势 " ,J. Li 和 了 下 Y. Ye 也 
指出 ,识别 睡 美人 文献 时 应 避免 人 为 设 定 阔 值 。 在 这 
一 背景 下 ,本 文 借鉴 Bep 指数 "的 思想 ,尝试 提出 新 
的 识别 方法 。 
2.1 Bep 指数 

Bcp 指数 (公式 1) 的 提出 经 历 了 对 B 指数 "以 及 
SBe 指数 "的 完善 ,是 一 种 发 展 较为 成 熟 的 客观 识别 
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方法 。 其 示意 如 图 1 所 示 , 其 中 ,参考 线 1 为 “论文 发 
表 当 年 被 引 次 数 点 "(0,C,) 到 “年 度 被 引 次 数 累 积 百 
分 比 达到 1 的 点 "(1,,1) 的 连 线 。 在 公式 (1) 中 , (1 - 
Cu)]t 代表 参考 线 1 的 斜率 ,对 于 任意 t<t, ,计算 1 与 
C, 的 差 值 ,之 后 将 t=0 到 t=t, 的 差 值 相 加 。 


1 -6 


Bcp = > EE 公式 (1) 


tw 


年 度 被 引 次 数 昧 计 百 分 比 


图 1 Bep 指数 示意 


Bcp 指数 识别 法 的 核心 思想 在 于 计算 引文 曲线 的 
离 帮 程度 。 睡 美人 文献 具有 前 期 低 被 引 , 而 后 突然 高 
被 吉 的 重要 特征 ,这 造成 其 累计 引文 曲线 的 离散 程度 
” ,因此 ,本 文 引入 统计 学 中 的 “变异 系数 "这 一 
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概念 ,以 期 探索 不 同 引 文 曲 线 类 型 及 其 离散 程度 ,并 依 
此 进行 睡 美人 文献 的 识别 。 
2.2 变异 系数 

变异 系数 (Coefficient of Variation ,CV ) 又 称 差异 系 
数 或 离散 系数 ,是 用 以 表示 数据 分 布 离散 程度 的 归 一 
化 量度 ,其 定义 为 各 单位 的 标准 差 与 平均 数 之 比 ， 
计算 公式 为 : 


CV = pe 公式 (2) 


公式 (2) 中 ,o 为 标准 差 ;k 为 平均 数 。 
变异 系数 属于 无 量 岗 量 ,其 计算 过 程 中 消除 了 

不 同 量 纲 级 别 数值 的 差异 ,数据 之 间 的 可 比 性 较 强 ,这 
也 使 得 后 续 工 作 中 构建 引文 曲线 研究 框架 时 ,为 模拟 
引文 曲线 类 型 而 设 定 的 引文 量 不 会 对 研究 结果 造成 影 
啊 , 只 需 着 重 关注 引文 曲线 的 形态 。 
2.3 不 同 引文 曲线 的 变异 系数 

引文 曲线 又 被 称 为 引文 模式 .引文 历史 或 引文 生 
命 周 期 " ,通过 图 形 直观 地 描述 引文 量 随时 间 的 分 布 
变化 。 已 有 多 位 学 者 对 引文 曲线 类 型 进行 了 归纳 总 
结 …” 下 ( 见 表 1)。 


表 1 引文 曲线 类 型 划分 


ey 学 者 发 表 时 间 划分 类 型 
S<. Re 9g D 发 表 初 期 即 被 认可 的 文献 ; 避 被 认可 程度 一 般 的 文献 ;几乎 未 被 认可 的 文献 ;四 发 表 初期 被 认可 但 迅速 被 气 弃 的 广 
献 ;@ 前 期 被 认可 程度 低 ,之 后 逐步 上 升 的 文献 1201 
.S$. Aversa 1985 加" 缓慢 增长 -缓慢 下 降 "型 ;@“ 快 速 增长 -快速 下 降 "型 [21] 
aVssCano, N. C. Lind 1991 @D 早 期 累积 了 大 部 分 引用 ,之 后 被 引 量 逐 渐 下 降 ;@ 被 引 量 在 发 表 初 期 (前 六 年 ) 适 度 增长 ,之 后 稳定 增长 :21 
李江 等 2014 ”经 典型 ;指数 增长 型 ;@ 睡 美人 型 ;@ 双 峰 型 ;加 波 型 [1 
届 文 建 等 2017 @ 经 典型 ;@ 指 数 下 降 型 ;@ 指 数 增长 型 ; 轩 睡 美人 型 ;@@ 多 峰 型 @ 波 型 123] 
李 凌 英 等 2019 @ 上 升 - 下 降 型 ;@ 波 动 型 ;@ 下 降 -上 升 型 ;@ 指 数 增长 型 ;@ 逐 年 上 升 型 ;@ 延 迟 认可 型 24] 
宋 呈 玉 等 2019 经 典型 ;加 指数 增长 型 ;加 县 花 一 现 型 ;@ 睡 美人 型 4 
能 泽 泉 2019 四 典型 单 峰 型 ;G@) “类 睡 美人 "型 ;@ 峰 度 较 低 的 单 峰 型 ;@" 缓 慢 上 升 - 缓慢 下 降 " 型 (马拉松 型 ) 35] 


由 表 1 可 知 , 相 关 研究 中 分 类 标准 的 侧重 点 有 所 
不 同 ,部 分 研究 以 绝对 被 引 量 为 切入 点 ,根据 文章 的 被 
认可 程度 进行 引文 曲线 类 型 的 划分 , 另 一 部 分 研究 则 
侧重 于 相对 被 引 量 进行 引文 曲线 形态 的 区 分 。 考 虑 到 
睡 美人 文献 本 身 为 高 被 引文 献 “” ” ,并 且 为 了 能 

较为 全 面 地 了 解 不 同类 型 引文 曲线 的 离散 程度 ,本 文 
对 表 !1 梳理 的 引文 曲线 类 型 进行 归纳 后 ,采取 如 下 研 
究 框架 :四 经 典型 :这 类 文献 符合 文献 老化 的 一 般 规 
律 , 即 发 表 前 期 累计 大 部 分 引用 并 达到 被 引 峰值 ,之 后 
被 引 量 逐渐 下 降 。 包 县 花 一 现 型 :发 表 后 快速 到 达 被 
引 高 峰 , 之 后 被 引 次 数 迅 速 下 降 。@ 指 数 增 长 型 :发 表 


后 年 度 被 引 量 不 断 递 增 。 此 类 文献 又 被 称 为 天 才 型 论 
文 , 较 为 罕见 ” 。@ 睡 美人 型 :文献 发 表 前 期 低 被 引 ， 
的 伏 一 段 时 间 后 被 引 量 剧 增 ,也 称 延迟 认证 型 。@) 多 
峰 型 :其 引文 历史 多 次 出 现 峰值 ,也 称 波动 型 。 

确定 研究 框架 后 ,对 上 述 5 种 引文 曲线 进行 模拟 。 
假设 5 篇 文献 均 发 表 于 2000 年 , 且 截 至 2019 年 共 被 
引用 300 次 ,根据 各 类 型 引文 特点 绘制 其 年 度 被 引 曲 
线 ( 见 图 2) 及 累计 被 引 曲 线 ( 见 图 3), 并 分 别 计算 二 
者 的 变异 系数 ,计算 结果 见 表 2。 
由 表 2 的 测试 结果 可 知 , 就 年 度 被 引 曲 线 而 言 , 睡 
美人 型 和 县 花 一 现 型 引文 曲线 的 CV 值 高 于 其 他 类 型 ， 
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© 
ON 
a 表 2 5 种 引文 曲线 及 其 两 类 CV 值 
QV 关 型 经 典型 ”县 花 一 现 型 指数 增长 型 ” 睡 美人 型 多 峰 型 
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但 县 花 一 现 型 文献 的 累计 被 引 CV 值 却 明显 低 于 其 他 
类 贺 。 就 累计 被 引 曲 线 而 言 , 睡 美人 型 与 指数 增长 型 都 
有 具 有 和 较 高 的 CV 值 。 这 一 现象 表明 , 仅 利用 一 项 引文 曲 
线 的 CV 值 识 别 睡 美人 文献 时 ,有 可 能 会 造成 其 与 指数 
增长 型 或 县 花 一 现 型 文献 的 混淆 。 为 了 更 加 准确 地 进 
行 睡 美人 文献 的 识别 工作 , 需 把 握 其 两 类 CV 值 均 较 高 
的 这 一 特性 ,因此 ,本 文 使 用 两 类 曲线 变异 系数 的 乘积 
大 小 来 判断 一 篇 文献 可 以 被 视 作 是 睡 美 人 文献 的 程度 ， 
并 将 这 一 指标 记 作 变异 系数 之 乘积 指数 ,PCYV 指数 
(Product of CV,,, and CVaemuaive ) ,计算 方式 如 下 : 
PCV = CV X CV ,maive 公式 (3) 
其 中 ,CVyearly 代表 年 度 被 引 曲线 的 变异 系数 ， 
CVmuse 代 表 累 计 被 引 曲 线 的 变异 系数 。 


3 实证 研究 


3.1 选择 数据 源 
本 文 以 Web of Science( WoS ) 数据 库 的 核心 合集 


m 


作为 数据 源 ,选择 WoS 分 类 为 “information science & li- 
brary science”, 为 保证 文献 有 15 至 25 年 的 引文 窗 , 限 
定 文献 发 表 时 间 为 1995 至 2004 年 ,文献 类 型 为 “Arti- 
cle”, 共 检索 出 23 913 篇 文献 。 

由 于 睡 美人 文献 本 身 为 高 被 引文 献 “” ,这 为 
识别 工作 前 期 的 数据 源 筛 选 提供 了 启示 。 本 文 借鉴 普 
赖 斯 定律 (公式 4) 确定 高 被 引文 献 ” 。 

N= V0.749 xm 公式 (4) 
其 中 ,N 代表 高 被 引文 献 的 最 小 被 引 次 数 ,ni 代 
表 文 献 集中 被 引 量 最 高 论文 的 被 引 次 数 。1995 - 2004 
年 ,该 领域 被 引 最 多 的 文献 被 引 频 次 为 8 606, 计 算出 
N 为 80.29 ,最 终 筛 选 出 1 098 篇 被 引 频次 大 于 等 于 81 
的 文献 。 
3.2 识别 结果 

对 获取 到 的 引文 数据 进行 处 理 并 对 文献 进行 编 
号 ,编号 由 文章 发 表 年 份 后 两 位 数字 及 该 年 度 文献 根 
据 被 引 次 数 降序 排列 的 序号 组 合 而 成 (如 文献 编号 95 

-1 ,代表 发 表 于 1995 年 且 在 1995 年 的 文献 集中 被 引 
频次 排名 第 1 的 文献 ) 。 之 后 进行 PCV 值 的 计算 ， 
1 098 篇 文献 的 PCYV 值 分 布 情况 如 图 4 所 示 : 


PCV 
人 
oo 


0 100 200 300 400 500 600 700 800 900 1000 1100 


序号 
4 了 PCYV 值 分 布 情况 


由 图 4 可 知 , 绝 大 多 数 文献 的 PCV 数值 集中 于 
0.25 至 1.00 区 间 内 ,小 部 分 文献 的 PCV 值 小 于 0. 25 
或 大 于 1.00。 为 验证 本 文 提出 的 识别 方法 ,借鉴 已 有 
识别 方法 相关 研究 ” ,在 目标 文献 中 选取 PCV 值 排名 
TOP10 的 文章 进行 进一步 的 识别 效果 评估 ,TOP10 文 
章 的 相关 信息 见 表 3。 
3.3 效果 评估 
3.3.1 PCYV 指数 的 有 效 性 

为 明确 利用 PCV 指数 识别 出 的 结果 是 否 符合 睡 
美人 文献 的 特征 定义 ,需要 进行 有 效 性 检验 。 目 前 睡 
美人 文献 识别 方法 的 有 效 性 检验 主要 包括 2 种 方式 ， 
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表 3 了 PCYV 值 排名 TOP10 的 文献 


序号 PCV 值 文献 编号 文章 标题 
1 1.82 02 -99 Matrix analysis as a complementary analytic strategy in qualitative inquiry 
2 1.39 01 -103 E-governance and smart communities - A social learning challenge 
3 1:35 02 -61 Searching for safety online: Managing trolling in a feminist forum 
4 1.35 00 -21 Medical subject headings (MeSH ) 
5 1.33 99 -22 Knowledge discovery through co-word analysis 
6 1.28 96 -59 A new methodological approach to bibliographic coupling and its application to the national ，regional and institutional level 
了 1.18 95 -48 Query evaluation : Strategies and optimizations 
8 1 01 -123 Joint and individual interviewing in the context of cancer 
9 1.04 99 -35 Ten tips for reflexive bracketing 
10 1.02 01 -32 Bibliometric cartography of information retrieval research by using co-word analysis 
\ 二 2 一 nA 、 SA 人 已 
一 是 进行 引文 曲线 效果 分 析 , 二 是 与 其 他 识别 方法 进 (1) 引 文 曲 线 效果 分 析 。 观 察 引文 曲线 的 形态 能 
行 ]} 二 香 谈 A yp pr y pp) 
了 识别 结果 重复 率 的 对 比 。 本 文 将 从 以 上 两 方面 人手 | 够 简单 且 直 观 地 判断 识别 方法 的 有 效 性 , 现 绘制 PCV 


PCV 指数 法 的 有 效 性 。 值 排名 TOP10 文章 的 引文 曲线 ( 见 图 5) 。 


25 [一 一 01-103 


检验 
OO » 
S 由 由 
mh mm 
将 其 
< 十 四 起 
© 人 
G 
© 
CN 2004 2007 2010 203 2016 2019 2001 2004 2007 2010 2013 2016 2019 
本 国 年 份 年 份 
之 50 0— 00-21 
© 二 
| 咯 咯 | 
[LT rh - 二 30 
一 总 R | 
世 茹 | 
OO 对 二 20 \| 
时 
10 = 
U 
9 P00 a 
. mm 有 
本 T - T > T 要 T T T 到 ,9 
2004 2007 2010 2013 2016 2019 2001 2004 2007 2010 2013 2016 2019 
年 份 年 份 
40 —o0—99-22 [一 一 96-59| 
[| 
PE | a 
15 用 
30 
| a 
吊 25 | 喇 | 
mm 到 b 示 10 o | | 
挡 20 | 摊 ' 
出 其 EAN 
革 15 J 过 a 1 AY 
b 一 D 一 D | D D | 
10 5 \ a D | 
f= 
5 Po |! \ | 上 
= -nn 六 \ nA Dp-a | 9 
0 一 一 一 一 一 一 一 一 0 一 ”一 一 一 一 rr 一 一 一 一 一 一 
2001 2004 2007 2010 2013 2016 2019 1998 2001 2004 2007 2010 2013 2016 2019 
年 份 年 份 


96 


唐 洁 ， 


ChinaXiv 合 作 期 刊 


曾 静 静 . 应 用 变异 系数 识别 睡 美人 文献 研究 [可 .图 书 情 报 工 作 ,2021 ,65(6) :93 - 101. 


年 度 被 引 量 


古 
只 n BbB b 


0 OO 
1995 1998 2001 2004 2007 2010 2013 2018 2019 


年 份 
30 99—35 
口 
20 
喇 
站 | 
芷 | 
te [= = 
寺 10 | 
| 
已. b-0o 
Le 
只 站 
0 各 = 
2000 2005 2010 2015 2020 
年 份 


304.00666v1 


CN 观察 图 5 中 TOP10 文章 的 引文 曲线 可 知 ,PCV 值 

和 1 至 6 及 第 8、 第 10 的 文章 (文献 编号 02 -99 、 
01=—=103 02 -01 00 -21 .99 -22 .96 -39 01 - 123 01 
- 完 ) 呈现 出 了 较为 明显 的 发 表 前 期 低 被 引 后 期 突然 

引 这 一 规律 ,8 篇 文献 均 经 历 了 较为 明显 的 沉 用 
上 人 排名 为 第 7、 第 9 的 文章 (文献 编号 95 - 48 .99 - 
3 天 沉睡 期 内 被 引 量 出 现 了 短暂 的 波动 ,但 由 于 增幅 
较 屿 是 持续 时 间 短 ,其 发 表 前 期 年 均 被 引 量 仍然 较 低 。 
总 体 而 言 ,TOP10 文章 的 引文 曲线 均 表现 出 了 睡 美人 
文献 的 基本 特征 。 

(2) 识 别 结果 重复 率 的 对 比 。 考 虑 到 PCV 指数 与 
Bep 指数 的 识别 思路 有 相似 之 处 ,本 文 将 二 者 识别 结 
果 进 行 了 对 比 。 表 4 列 出 了 两 种 识别 框架 下 排名 前 10 
的 文章 及 该 文章 在 另 一 种 识别 框架 下 的 排名 情况 。 
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5 了 PCY 值 排名 TOP10 文献 的 年 度 引 文 曲 线 


表 4 了 PCYV 指数 与 Bcp 指数 TOP10 对 比 


PCV 值 TOP10 Bep 排名 Bep 值 TOP10 PCV 排名 
02 -99 4 95 -48 7 
01 -103 15 00 -21 4 
02 -61 18 96 -3 17 
00 -21 2 02 -99 1 
99 -22 5 99 -22 5 
96 -59 7 95 -2 44 
95 -48 1 96 -59 6 
01 - 123 51 95 -3 46 
99 -35 25 95 -5 40 
01 -32 27 96 -31 21 


注 :在 两 种 指数 TOP10 中 重复 出 现 的 文章 使 用 粗 斜体 标注 
3.3.2 了 PCYV 指数 与 Bcp 指数 的 差异 性 
为 进一步 探究 PCV 指数 与 Bep 指数 在 识别 睡 美 


由 表 4 可 知 ,在 两 种 识别 框架 下 排名 前 10 的 文章 

中 有 5 篇 重合 ,重复 率 达 到 50% 。 现 将 已 有 的 不 同 识 
别 方法 识别 结果 重复 率 梳理 如 下 表 ( 见 表 5) 。 
由 表 5 可 知 , 不 同方 法 识别 结果 的 重复 率 差 异 较 
大 ,数值 最 高 为 73% ,最 低 为 0% 。 有 学 者 指出 ,这 种 
差异 性 与 识别 方法 的 特点 以 及 睡 美 人 引文 曲线 的 形态 
有 关 ""。 在 本 研究 中 ,设置 对 比 范围 为 TOP10 的 情况 
下 ,重复 率 达 到 50% ,参考 上 述 研究 成 果 与 结论 ,可 以 
认为 本 文 提出 的 PCV 指数 识别 方法 是 有 效 的 。 


人 文献 方面 的 差异 ,本 文选 取 两 种 计算 框架 下 TOP10 
中 相互 不 重 肆 的 10 篇 文章 作为 分 析 对 象 ,借鉴 相关 研 
究 ”" 选择 如 下 6 项 指标 考察 二 者 的 差异 性 :@D 发 表 
时 长 :文章 发 表 年 至 2019 年 历经 的 时 间 跨 度 ( 鉴 于 
2020 年 的 数据 暂 不 完整 , 故 以 2019 年 作为 截止 时 
间 ) 。@) 总 被 引 : 文 章 自发 表 至 2019 年 的 总 被 引 次 数 。 
(3) 年 均 被 引 :总 被 引 量 与 发 表 时 长 的 比值 。@ 被 引 峰 
值 :最 高 年 度 被 引 次 数 。@@ 睡 眠 时 长 :借鉴 van Raan” 
的 相关 定义 , 将 文章 年 均 被 引 量 处 于 0 至 2 次 所 经 历 
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表 5 各 识别 方法 重复 率 对 比 


识别 数据 识别 方法 对 比 对 象 对 比 范围 (TOP N) 重复 率 
1970 - 2005 年 发 表 于 四 大 医学 名 刊 的 高 被 引文 献 [31] 被 引 速 率 B 指数 10 10% 
社会 科学 及 商业 经 济 学 领域 包含 “创新 ”这 一 关键 词 的 文献 [3] K 指 净 3 指标 法 53 0% 
K 指 妆 B 指数 $3 25.0% 
Science 及 Nature 杂志 中 的 文献 [21 Bep 指数 B 指数 20 60.0% 
WoS 数据 库 中 发 表 于 1988 -2007 年 的 图 书 情报 领域 的 文献 [321 被 引 速率 B 指数 35 68.6% 
K 指数 被 引 速 率 35 42.9% 
K 指 妆 B 指数 35 31.4% 
WoS 数据 库 中 发 表 于 1998 -2002 年 的 图 书 情报 领域 的 文献 5] 线 拟 合法 K 指数 4 75% 
WoS 数据 库 中 发 表 于 1998 -2003 年 的 图 书 情 报 领域 的 文献 [4 引文 导数 法 被 引 速 率 10 60% 
WoS 数据 库 中 发 表 于 1995 -2004 年 的 图 书 情报 领域 的 文献 PCYV 指数 Bep 指数 10 50% 


的 时 长 定义 为 睡眠 时 长 。 人 唤醒 强度 :文献 结束 睡眠 
期 后 4 年 内 的 年 均 被 引 量 。 统 计 以 上 指标 ( 见 表 6 ) 并 


对 其 进行 独立 样本 了 检验 ,检验 结果 见 表 7。 


表 6 排名 差异 较 大 的 文章 指标 对 比 


~> 文章 类 型 文章 编号 ”PCYV 排名 Becp 排名 发 表 时 长 ”总 被 引 量 ”年 均 被 引 ”被 引 峰值 ”睡眠 时 长 ”唤醒 强度 
(GC 排名 高 于 Bep 排名 01 -103 2 15 18 99 5.50 20 14 T1375 
(© 02 -61 3 18 17 112 6.59 30 10 12.25 
《9 01 -123 9 51 18 88 4.89 20 14 13.5 
三 99 -35 8 25 20 153 7. 65 24 10 6.5 
时 01 -32 10 27 18 88 4.89 20 14 13.5 
cs 排名 高 于 PCV 排名 96 -3 17 3 23 677 29.43 77 6 8.75 
《CD 95 -2 44 6 24 2009 83.71 167 3 6. 25 
GN 95 -3 46 8 24 1563 65. 13 141 2 10.75 
OO 95 -5 40 9 24 992 41.33 79 8 18.25 
A 96 -31 21 21 23 167 7.26 ph 3 12.25 


NN ” 表 7 PCYV 指数 和 Becp 指数 指标 差异 检验 


(日 指标 识别 方法 。 个案 数 均值 ”Sig. ( 双 侧 ) 
CC 发 表 时 长 PCV 5 18.20 0. 000 ( #9 
mm 
os Bep 5 23.60 
人 总 被 引 PCV 5 108.00 0.040( *#*) 
Bep 5 1081. 60 
年 均 被 引 PCV 5 5.90 0.042( # ) 
Bep 5 45.37 
被 引 峰 值 PCV § 22. 80 0.039( #* ) 
Bep 5 98.20 
生 虐 时 长 PCV 5 12.40 0.001( #9 
Bep 5 4.40 
唤醒 强度 PCV 5 11.90 0.797 
Bep 5 11.25 


注 : * 表 示 在 0.05 的 水 平 显著 ; ** 表 示 在 0.01 的 水 平 显著 
由 检验 结果 可 知 ,PCV 指数 与 Becp 指数 识别 出 的 
睡 美 人 文献 在 发 表 时 长 .总 被 引 、 年 均 被 引 、 被 引 峰 值 
4 项 指标 上 具有 显著 性 差异 ,Bep 排名 较 高 的 文献 以 上 
4 项 指标 均 高 于 PCV 排名 较 高 的 文献 。 这 一 结果 显 
示 ,Bcep 指数 对 于 发 表 时 间 长 且 被 引 量 高 的 文献 更 敏 


的 文献 平均 睡眠 时 长 为 4.40 
这 一 数值 为 12.40, 这 说 明 P 


者 没有 显著 性 差异 。 


体系 的 一 个 有 效 补充 。 


4 ”结论 与 讨论 


文献 其 "沉睡 "的 特质 更 为 明显 。 在 唤醒 强度 方面 ， 


感 ,PCV 指数 则 更 易 识 别 出 较 为 年 轻 的 睡 美 人 文献 。 
此 外 ,二 者 的 睡眠 时 长 具有 显著 性 差异 ,Bep 排名 较 高 


,而 PCV 排名 较 高 的 文献 
CV 指数 识别 出 的 睡 美人 


综 上 分 析 ,PCV 指数 法 可 以 成 为 睡 美人 文献 识别 


各 类 方法 的 优 缺 点 ,为 扩充 有 


本 文 回 顾 了 现 有 的 睡 美人 文献 识别 方法 ,总结 了 


重 美 人 文献 的 识别 方法 体 


系 ,提出 了 PCYV 指数 。PCYV 指数 借鉴 Bep 指数 的 识别 
思想 ,以 衡量 引文 曲线 的 离散 程度 为 核心 ,同时 考虑 到 
文献 的 年 度 被 引 曲 线 和 累计 被 引 曲 线 ,进一步 降低 了 
识别 过 程 对 于 文献 总 被 引 次 数 的 依赖 性 ,能 够 更 加 灵 
活 地 发 现 一 些 发 表 年 限 较 短 且 呈 现 出 “ 睡 美人 ”特征 
的 文献 。 同 时 ,在 与 Bep 指数 的 识别 结果 进行 对 比 时 


还 发 现 ,PCV 指数 识别 出 的 图 


美人 文献 睡眠 时 间 更 长 。 
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此 外 ,PCV 指数 的 计算 依托 于 变异 系数 ,计算 简单 。 综 
上 所 述 ,PCV 指数 是 一 种 有 效 .灵活 上 且 易 操作 的 睡 美人 
文献 识别 方法 。 

PCYV 指数 法 同样 存在 一 些 不 足 。 首 先 ,作为 一 种 
客观 指标 法 ,PCV 指数 法 存在 与 其 他 客观 指标 法 相同 
的 缺陷 , 即 无 法 绝对 明确 地 划分 睡 美人 文献 与 其 他 类 
型 文献 的 界限 。 其 次 ,本 文 在 进行 实证 研究 时 选取 
了 高 被 引文 献 为 数据 源 ,但 变异 系数 本 身 的 特性 与 效 
果 评估 的 结果 都 显示 出 PCV 指数 对 于 总 被 引 次 数 的 
依赖 性 极 低 , 因 而 在 识别 结果 对 比 中 ,Bep 指数 识别 出 
了 总 被 引 量 更 高 .影响 力 更 大 的 睡 美人 文献 。 针 对 此 
问题 ,未 来 可 以 根据 具体 的 研究 需求 在 筛选 数据 源 时 
进一步 提高 对 于 总 被 引 量 的 限制 。 

最 后 ,本 研究 还 衍生 出 了 以 下 问题 需要 进一步 的 
说 网 + 与 讨论 。 
44D 学 科 特 点 对 于 识别 效果 的 影响 
写本 研究 以 图 情 领域 的 高 被 引文 献 为 样本 ,选取 样 
本 的 TOP10 作为 分 析 对 象 ,这 10 篇 文章 的 PCV 值 
yD 02 到 1. 82 不 等 ,数值 较为 分 散 , 且 随 着 数值 的 降 
做 祥 献 所 呈现 出 的 “ 睡 美 人 "特性 有 所 减弱 ,这 一 现 
仇 鸭 产生 与 选取 的 研究 样本 特征 有 关 : 一 方面 ,本 领域 
不 鹿 于 易 产生 顶级 睡 美人 文献 的 学 科 , 另 一 方面 ,本 文 
M0 入 日光 入 纪 , 这 凤 因 家 帮凶 影响 
组 的 识别 效果 。 此 外 ,客观 识别 法 不 对 文献 某 一 时 
期 的 被 引 量 进行 数值 上 的 限制 , 旨 在 消除 主观 识别 法 
在 受 置 阔 值 时 的 主观 性 和 随意 性 ,但 这 也 造成 了 睡 美 
人 食 献 与 其 他 文献 没有 明确 的 分 界线 ,最 终 在 筛选 时 
不 可 避免 地 需要 进行 人 为 界定 。 本 文选 择 TOP10 为 
ee 
科学 领域 内 睡 美人 文献 的 数量 差异 ,这 一 标准 是 否 
用 于 其 他 学 科 领 域 仍 有 待 验证 。 

4.2， 引文 曲线 变异 系数 的 拓展 应 用 

不 同类 型 引文 曲线 的 变异 系数 计算 结果 显示 , 除 
了 睡 美人 文献 之 外 ,还 存在 其 他 具有 特殊 CV 值 的 文 
献 类 型 。 例 如 ,县 花 一 现 型 文献 前 期 高 被 引 ,之 后 被 引 
量 又 降 , 这 使 得 它 同 样 具有 较 高 的 年 度 被 引 CV 值 ,但 
由 于 这 类 文献 较 早 达到 其 引文 峰值 ,在 此 之 后 因 技术 
更 替 或 研究 主题 转移 等 因素 很 快 被 遗忘 ,因而 后 期 
被 引 量 增长 不 足 , 总 被 引 量 较 早 达到 稳定 状态 ,最 终 造 
成 其 累计 被 引 曲 线 的 CV 值 低 于 其 他 类 型 的 文献 ,之 
后 可 尝试 利用 上 述 特点 进行 相应 的 识别 工作 。 


4.3 了 PCY 指数 与 Bcp 指数 的 差异 性 探究 

考虑 到 PCV 指数 法 在 识别 思路 上 与 Bep 指数 法 
具有 相似 性 ,本 研究 进行 了 二 者 的 识别 结果 重复 率 对 
比 ,在 目标 范围 内 重复 率 达 到 了 50% ,参考 已 有 重复 
率 对 比 的 结果 ,该 数值 处 于 较 高 的 水 平 , 然 而 仍 略 低 于 
预期 值 ,有 必要 进一步 探讨 这 一 现象 的 成 因 。 从 二 者 
的 计算 过 程 来 看 ,Bcp 指数 为 规避 对 被 引 次 数 规模 的 
依赖 ,将 年 度 被 引 曲 线 的 纵 坐 标 改 为 “年 度 被 引 次 数 累 
积 百分比 ” ,但 由 于 其 计算 包含 引文 曲线 各 点 到 参考 线 
距离 的 累加 过 程 ( 见 公式 (1) ) ,该 方法 对 于 发 表 时 间 
较 长 的 文献 更 为 敏感 ,这 也 从 某 种 程度 上 解释 了 为 何 
在 差异 性 检验 ( 见 表 7) 中 ,Bep 指数 法 识别 出 的 文献 
其 发 表 时 长 明显 更 高 。 然 而 ,PCYV 指数 由 两 种 引文 曲 
线 的 变异 系数 构成 ,其 核心 是 考察 “离散 程度 ” ,这 也 
PCV 识别 出 的 部 分 文献 其 引文 曲线 波动 较为 明 

。 综 上 所 述 ,两 种 方法 的 思想 有 相似 之 处 ,但 其 差异 
| 见 存在 的 。 
4.4 ”有 睡 美人 文献 识别 方法 的 优化 

识别 睡 美人 文献 的 方法 体系 在 不 断 扩充 ,然而 ,在 
把 握 睡 美人 文献 基本 特征 的 基础 上 ,不 同 识别 方法 的 
切入 点 和 侧重 点 有 所 不 同 ,这 造成 了 识别 结果 差异 的 
普遍 存在 。 此 外 ,有 学 者 提 到 , 睡 美人 文献 引文 曲线 的 
不 同 阶 段 受到 不 同 因 素 的 影响 ,因而 其 形态 多 样 复 
杂 "”。 综 上 所 述 ,车 将 识别 方法 看 作 一 个 睡 美人 文献 
的 检索 系统 ,做 到 不 误 检 不 漏 检 是 有 一 定 难度 的 。 为 
保证 识别 方法 的 科学 性 ,客观 指标 法 逐渐 替代 主观 指 
标 法 成 为 主流 ,但 在 实践 过 程 中 发 现 ,由 于 其 仍然 需要 
人 为 选择 TOP N 为 界限 ,这 也 显示 出 客观 指标 与 主观 
判断 相 结 合 的 必要 性 。 此 外 ,近年 来 多 位 学 者 提 到 通 
过 对 现 有 方法 的 组 合 使 用 来 提高 识别 的 准确 性 与 全 面 
性 ,从 而 达到 互相 约束 和 补充 的 效果 ,但 如 何 选择 
识别 方法 进行 组 合 还 需要 针对 各 个 研究 方法 的 特点 进 
行 实践 探究 。 其 次 ,根据 大 多 数学 者 在 实践 中 对 于 客 
观 识 别 方法 的 选择 倾向 ,结合 穆 尔 斯 定律 与 齐 普 夫 最 
省 力 法 则 可 知 ,方法 的 优化 不 仅 在 于 准确 性 的 提高 ,其 
易 操作 性 也 不 容 忽 视 ,未 来 能 否 兼 顾 二 者 进行 睡 美人 
文献 的 识别 亦 是 必要 的 尝试 。 
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Abstract: | Purpose/ significance | This paper aims to review existing identification methods of sleeping beauties 


in science, discuss strengths and weaknesses of different kinds of methods, and put forward a brand-new method for 


identifying sleeping papers. | Method/ process | This study is based on the Bep index, which is a well-developed 
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persion degree” of citation curve for identification, the concept of “ coefficient of variation” in statistics is introduced 


to the new method. Then the PCV index is proposed to identify various citation curves, sleeping beauties in particu- 


人 | Result/ conclusion | As is shown in the results, PCV index can effectively identify the sleeping beauties litera- 


Ere， In addition, compared to the Bcp index, the new method has the advantages of simplicity and accuracy, and 
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